智慧應用 影音

可靠、高效建構AI Agent實用指南:re:Invent 2025

  • DIGITIMES / 台北
  • 2025-12-05 00:00:00
台灣時間2025年12月4日,AWS re:Invent 2025進入第三日。AWS Agentic AI副總裁Swami Sivasubramanian發表題為《Agentic AI的未來已來的主題演講,系統闡述建構可靠AI Agent的核心技術路徑,並圍繞「易於建構(Easy to Build)」、「高效(Efficiency)」、「可信(Trust)」及「可靠(Reliability)」四大支柱,發布多項重大創新。值得注意的是,Amazon Nova Act服務的可靠性已達90%%,Amazon Bedrock強化微調功能的準確性提高66%% ,而Amazon Nova Forge則開創了「開放訓練模型」的新典範。
圖說:AWS Agentic AI副總裁Swami Sivasubramanian。
Swami博士以自己高中時期的程式設計經歷開場,喚起共鳴:「還記得第一次成功編寫程式時那種成就感與自由感嗎?那種可以創造任何你想要的物件、釋放全新可能性世界的興奮感?」他進一步指出,AI Agent正從「技術奇蹟」轉變為可帶來業務價值的實用工具 ,這核心轉變源於兩大突破:第一,建構門檻正在迅速改變,開發人員現可使用自然語言進行建構,無需受制於「對語言語法的熟悉程度,或必須記住數百個API呼叫和參數」;第二,建構速度亦在改變,開發週期從數年或數月縮短至數周,甚至數天。然而,Swami博士也直言不諱地指出一個嚴峻的現實:大多數企業正陷入「概念驗證(PoC)困境」,無數出色的Agent原型無法進入生產環境。
如何打破這個困境?Swami博士清晰地展示了答案:正是透過圍繞「易於建構、高效、可信、可靠」四大支柱建構生產級AI Agent。
圖說:四大支柱建構生產級AI Agent。
易於建構 應對五大生產挑戰
Swami博士表示,傳統Agent開發需預設所有場景流程,這使得程式碼難以維護 ,並容易在發生意外情況時失敗。此外,大多數概念驗證(PoC)並未考量五大生產障礙:快速部署能力、複雜的記憶系統、身分與存取權限管理、工具的互通性及可觀測性。
圖說:大多數概念驗證(PoC)並未考量五大生產障礙。
AWS的解決方案是雙管齊下。
首先AWS推出了開源Agent開發框架Strands Agents SDK。它採取模型驅動方式,允許模型自主應對任何場景,從而無需預設工作流程和複雜協調程式碼。此功能已在AWS內部得到充分驗證,省卻了數千行多餘程式碼,同時提高Agent準確性與程式碼維護性。自5月發布預覽版以來,Strands下載量已超過500萬次。
今日發布的兩項核心功能使其更為強大:TypeScript支援,將Strands Agents SDK擴展至全球最流行的程式設計語言之一;以及邊緣裝置支援,開啟汽車、遊戲及機器人等領域的新應用情境。
圖說:AWS推出了開源Agent開發框架Strands Agents SDK。
然而,單憑優秀的開發框架並不足夠。Swami博士強調,PoC與生產之間的鴻溝需要一個託管系統來填補,Amazon Bedrock AgentCore正是為此而生。在現場演示中,Swami博士展示了AgentCore Identity的強大功能:只需數行程式碼,即可實現跨AWS應用程式與Slack、Zoom等第三方服務的無縫身分與存取權限管理,而從零開始建構同樣的功能則需花費數周。
今日發布的Episodic Memory進一步提升Agent能力。Swami博士以旅行助手為例:獨行旅客可能在航班起飛前45分鐘到達機場便已足夠,但若帶著兩個孩子和大量行李,Agent則需記住上次混亂的家庭旅行經歷,自動調整到達時間至兩小時。這不僅是記住過去 ,更是理解「使用者行為背後的時機和原因」。Agent的經驗越豐富,便會變得越聰明。
圖說:Amazon Bedrock AgentCore。
此外,昨日亦發布了兩項AgentCore新功能:Policy in Amazon Bedrock AgentCore在提供對Agent行為控制的同時,保留其推理和採取最佳行動的自由;而AgentCore Evaluations則允許開發人員在數千個模擬場景中評估和測試Agent,確保其在正式上線前達到生產級標準。
圖說:Swami博士宣布發布Policy與Evaluations兩項AgentCore新功能。
高效 模型客製化的關鍵路徑
Swami博士隨後將話題轉向效率。他指出,現成的大型模型(LLM)雖然智能,但並非總是最高效。效率不僅關乎成本,亦關乎延遲(回應速度)、規模(峰值處理能力)及敏捷性(疊代速度)三個關鍵維度。他指出,大多數Agent將時間花費在編寫程式碼、分析搜尋結果、創建內容等常規操作上,若能為這些任務客製化模型 ,便能大幅提高效率。
圖說:Deploying AI at Scale。
然而,像強化學習這類高級客製化技術門檻極高,需要博士級專業知識、複雜的分散式基礎設施,開發週期長達6至12個月。Swami博士介紹了四種客製化方案:監督式微調(SFT)、模型蒸餾、人類回饋強化學習(RLHF)及AI回饋強化學習(RLAIF)。其中,模型蒸餾可讓小型模型模仿巨型模型的決策邏輯,實現10倍加速,同時仍保持95-98%%的效能;SFT則重質不重量,1萬條優質Agent互動資料優於數百萬通用範例。大多數企業因而仍受制於「通用模型效能不足」與「客製化成本過高」的兩難境地 。
AWS的突破在於將這些高級技術自動化 。今日正式發布的Reinforcement Fine-Tuning(RFT)in Amazon Bedrock,讓普通開發人員亦能使用強化學習,且操作極為簡單:選擇基礎模型、指向Amazon Bedrock日誌,並選擇獎勵函數(如LLM評判器)即可完成。Amazon Bedrock將自動化整個RFT工作流程,相比基礎模型,準確性平均提升66%% ,效果十分顯著。
圖說:Reinforcement Fine-Tuning(RFT)in Amazon Bedrock。
針對需要更多控制的應用情境,今日發布的SageMaker AI Serverless Model Customization提供兩種體驗:其一為自助式體驗,適合希望自行管理整個流程的開發人員;其二為Agent驅動體驗,使用者只需以自然語言描述用例,由AI Agent建議合適的微調技術、產生合成資料集、配置Serverless訓練流程,並完成模型效果評估。原本需要機器學習工程師投入數月反覆試驗的工作,現可在數天內完成,整個過程由熟悉最佳實務的Agent協助實現,並支援最新的強化學習技術,包括RLAIF、RLVR及DPO。
Swami博士亦宣布一項可提高模型訓練彈性的新功能:Checkpointless Training on SageMaker HyperPod。傳統檢查點恢復會導致資源閒置數小時,而此功能透過持續儲存分散式集群中的模型狀態,實現分鐘級恢復,在硬體故障時可無縫替換設備,獲取正確的節點狀態——這堪稱一種方法上的重要變化。
圖說:Checkpointless Training on SageMaker HyperPod。
可信 可靠Agent的技術基石
Swami博士坦言,AWS早期建構的Agent原型曾出現「模型在API呼叫時產生幻覺」的問題。這引發了一個根本性問題:如何讓Agent真正可信?他指出,LLM可能會在複雜規則面前出錯或推理存在邏輯錯誤,一旦場景涉及金融交易、客戶信任等關鍵環節,單純的統計方法便遠遠不足。當人們不信任Agent時,往往會透過引入額外人手監督、硬性編碼每個操作步驟來過度補償,而這恰恰削弱了Agent本應具備的創造力與自主性。
為此,Swami博士特別邀請了AWS傑出科學家、自動推理領域權威Byron Cook登臺。Cook開場時便提出一個尖銳問題:「你會把信用卡交給Agent嗎?就像交給一個幾歲的小朋友去購物一樣,他可能會幫你買到你想要的商品,但最終你也可能得到一大堆你並不需要的東西」。
Cook詳細闡述了神經符號AI(Neuro-Symbolic AI)這一突破性方法。他解釋,自動推理是在數學邏輯中搜尋和仔細檢查證明的學科,與2,000年前歐幾里得證明定理的方法相同。AWS在內部系統使用此技術已超過十年,現在將其應用於Agentic AI。
圖說:自動推理領域權威Byron Cook。
Cook透過三個生動的例子,解釋如何將自動推理應用於AI Agent:
  • 驗證輸出: 自動推理工具會像嚴謹的數學老師一樣,逐步驗證LLM的推理過程,若發現錯誤則推回重試 ,形成回饋循環。
圖說:驗證輸出。
  • 訓練資料生成: 就像用標準答案的習題集訓練學生。使用Lean定理證明器創建無限量的「標準答案」,讓AI從一開始便學會正確推理。
圖說:訓練資料生成。
  • 約束解碼: 就像汽車的車道保持系統,當你偏離車道時,方向盤會自動微調將你拉回。在AI系統中,當模型試圖回答「法國的首都是什麼」並開始輸出字母「B」時,自動推理系統會即時介入,像導航一樣將其引導至正確的字母「P(Paris)」。這種即時糾偏確保了AI的輸出始終符合邏輯規則 。
Cook亦強調了Kiro的規範驅動開發:Kiro可分析應用程式、識別驗收標準並轉換為規範,進而指導程式碼生成、測試生成,甚至證明程式正確性。他隨後詳解了昨日發布的AgentCore Policy:只需用自然語言描述允許的操作,如阻止任何Agent在AWS生產帳戶的資源上執行更新操作,系統便會將其自動轉換為AWS兩年前開源,語義經Lean定理證明器形式化的Cedar策略語言,且這些策略可透過自動推理驗證主權、隱私、資安等要求。Cook總結:「形式化推理與生成式AI的結合,是建構可信Agent的遊戲規則改變者」。
可靠 生產就緒的可靠工具
Swami博士表示,企業需要的是「值得信任的Agent」,而非僅僅「能做事的Agent」。今天的Agent可能第一次能完成任務,但重複執行時卻會失敗。問題根源在於傳統機器人流程自動化(RPA)可靠但缺乏彈性,LLM具備彈性但協調複雜,需要建構錯誤處理和回溯機制,導致LLM在失敗路徑上運行很遠才意識到錯誤。
AWS給出的破局方案,是將端到端整合與強化學習深度融合。今日正式可用的Amazon Nova Act,專為建構和管理自動化生產UI工作流程的Agent團隊而設,在企業級工作流程場景中已實現90%%的高可靠性。Swami博士解釋說,Amazon Nova Act的獨特之處在於緊密整合的元件——模型、協調器、執行器、SDK端到端優化。更關鍵的是端到端訓練的理念:不是在「罐子裡培養大腦」,而是讓大腦和手腳一起訓練,出廠就會走路。
圖說:Amazon Nova Act。
Swami博士詳細解釋了訓練方法的創新。傳統的模仿學習讓Agent觀察和模仿專家行為,但Agent永遠不會理解行為的因果關係。因此,AWS轉向了強化學習 ,並創建了數百個RL「健身房」——複製模擬的真實企業環境,如CRM、HR系統、任務追蹤器等。在這些「健身房」中,Agent運行數千個工作流程,透過數十萬次互動進行試錯學習。每次成功完成任務Agent獲得獎勵,每次失敗獲得懲罰。透過這種方式,Amazon Nova Act學會了可靠地解決真實世界的企業用例。在RealBench和ScreenSpot等關鍵基準測試中,Amazon Nova Act的表現與業界最佳模型相當或更佳。
圖說:Amazon Nova Act Benchmarks。
協作 人機協作的Agent時代
闡述完四大核心技術支柱後,Swami博士特別邀請AWS應用AI解決方案高級副總裁Colleen Aubrey登臺,展示這些技術如何在實際客戶服務情境中發揮作用。Colleen開場即提出核心觀點:「未來數年,‘Agentic隊友’將如同身邊的同事一樣不可或缺」。
她強調,真正的效率並非「更少的努力」,而是「新產品、新服務、更佳的客戶體驗和新商業模式」。而實現這一切的關鍵,是讓AI成為團隊的一部分 ,嵌入到每個工作流程中。
Colleen以Amazon Connect為例進行闡明。這是一款雲上的AI原生全通路客戶服務應用程式,沿用Amazon內部同一技術,在全球範圍內已支持數十億次客戶對話。她透過生動的現場演示,直觀展示了人工客服代表與AI Agent無縫協作處理信用卡詐欺核查的完整流程。
圖說:人機協作的Agent時代。
在演示環節,Colleen將自己化身客戶。當她發現帳戶上有多筆可疑交易時,AI Agent首先透過整合了Amazon Nova Sonic神經聲音的自然語音對話驗證身分,鎖定實體卡但保留Apple Pay功能。當需要深入調查時,AI Agent將Colleen無縫轉接給人工調查員Hector,並自動共享所有上下文資訊,Colleen無需重複任何內容。
更令人印象深刻的是,Hector的「Agentic隊友」在短短數分鐘內便完成了通常需要數小時甚至數天的詐欺驗證工作。AI Agent自動分析了交易的地理模式,在地圖上標註出可疑位置,並開啟跨其他案例查找模式,迅速確認是一宗ATM側錄詐欺。
Hector甚至即場創建了一個客製化Agent,以簡單的自然語言提示定義其行為,讓它持續監控Colleen的所有帳戶,一旦發現可疑活動就發送資安訊息。最後,AI Agent分析了Colleen的完整帳戶和交易歷史,主動推薦了一個更安全的旅行帳戶,並指出她當晚在MGM Grand的晚餐預訂可以享受更佳的旅行獎勵。整個過程流暢自然,展示了人類與AI的分析能力如何完美結合。
Colleen宣布,本周Amazon Connect發布了8項新的Agentic AI功能,包括Amazon Nova Sonic聲音整合、即時推薦Agent、AI驅動的預測洞察以及多模態協作等核心功能,讓人機客服團隊能真正實現無縫協作。
Colleen總結道:「未來數年,人與Agent結合的團隊模式將從根本上改變工作方式。這不僅是把同樣的事情做得更快 ,而是釋放我們甚至無法想像的能力」。
圖說:Amazon Connect發布了8項新的Agentic AI功能。
展望 自由創造的時代
Swami博士在演講結尾回歸開場的主題。他說:「還記得你第一次成功編寫程式時的感覺嗎?那種成就感、自由感、解鎖新世界的興奮感」。今天,借助AI Agent,全球的建構者們每天都在體驗這種感覺。無論你是在清理海洋、解鎖人腦奧秘,還是解決尚未發現的挑戰,你都擁有了建構的自由 、從概念到影響的空前速度 、解決看似不可能問題的自由。
AWS正透過「易於建構、高效、可信、可靠」四大支柱讓每個人都能建構並運行生產級AI Agent。未來並非Agent能做所有事 ,而是我們能全然依賴它們做事 。讓我們共同建構這一令人驚嘆的未來!
無法去拉斯維加斯親自體驗?歡迎報名參與Best of AWS re:Invent (AWS 雲端科技發表會) 線上參與,一樣精彩!https://go.aws/48uR2Tx
關鍵字
大家都在看